Model Selection

Uncertainty-aware Reward

# Uncertainty-aware Reward

URM LLaMa 3.1 8B

URM-LLaMa-3.1-8B is an uncertainty-aware reward model designed to enhance the alignment of large language models.

Large Language Model

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase